24/01/2020

Introdução

Esta apresentação detalha os resultados referentes às análises do conjunto de dados intitulado wiki4HE. Este data set está disponível no UCI Machine Learning Repository e refere-se a percepções e práticas de professores sobre o uso da Wikipedia como recurso de ensino. O conjunto disponibiliza informações referentes aos professores, como sexo e idade, além de respostas a perguntas de escala Likert.

Inicialmente tem-se a análise descritiva das variáveis de caracterização dos professores via gráficos interativos e, posteriormente a análise com relação as respostas dadas às perguntas de escala Likert.

Variáveis sociodemográficas

Perguntas em escala Likert

Como mencionado, tem-se agora a análise descritiva das respostas com relação às perguntas em escala Likert, sendo estas apresentadas subdividas por tema.

Salienta-se que para melhor compreensão da análise é interessante passar o mouse sobre os gráficos de forma a aproveitar melhor a interatividade.

Relacionamento entre as perguntas

Tem-se a seguir um heatmap das correlações de spearman entre as variáveis de escala Likert. Esta medida é uma estatística não-paramétrica que mede a associação entre duas variáveis, não fazendo suposições de distribuição.

Valores Ausentes

No gráfico a seguir é apresentada a análise de observações ausentes, onde nota-se que OTHER_POSITION, Vis2 e UOC_POSITION foram as variáveis com maior quantidade de ausentes, possuindo 261, 117 e 113 valores faltantes, respectivamente.

ENJ1 e ENJ2 entre grupos

Agora é apresentada a análise comparativa de ENJ1 (O uso da Wikipedia estimula a curiosidade) e ENJ2 (O uso da Wikipedia é divertido) em relação a algumas variáveis sociodemográficas. Tem-se os resultados apresentados via gráficos boxplot.

Ainda, utilizou-se abordagens não-paramétricas para verificar as diferenças entre os grupos, sendo que, nos casos onde os testes apontaram diferenças significativas apresentam-se nos gráficos os valores-p, juntamente com o nome do teste aplicado.

Análise de agrupamento

Por fim, fez-se uma análise de agrupamento visando identificar grupos, tendo como base as respostas dadas as perguntas de escala likert. Destaca-se que, devido a quantidade de observações ausentes e visando ter perda mínima de dados para a análise, retirou-se as variáveis com mais de 10% de observações ausentes e utilizou-se métodos de imputação robusta para as demais variáveis.

A seguir tem-se o dendrograma e o gráfico de silhueta que demonstram e permitem visualizar que, considerando-se as respostas dadas, o ideal é dividir os professores em dois grupos. Salienta-se ainda, que o método de agrupamento utilizado foi o método de Ward.

Todas as análises foram desenvolvidas utilizando-se a linguagem R e os códigos podem ser obtidos no link